ter 16 jul 2019
Os programas de planilhas eletrônicas são interfaces gráficas muito úteis para projetar tabelas de dados e lidar com funções básicas de controle de qualidade de dados.


Planilhas são boas para entrada de dados E por isso, temos muitos dados em planilhas.



Muitas vezes são utilizadas também para:
criar tabelas de dados para publicações;
gerar estatísticas resumidas;
fazer figuras.
[AFFE, H. M. J. et al. Nitzschia martiana (CA Agardh) Van Heurck (Bacillariophyceae): distribution modelling and new records along the Brazilian coast. Diatom Research, v. 34, n. 1, p. 23-31, 2019.] link
[VIDAL, C. Y. et al. Heterogenization of remaining biodiversity in fragmented tropical forests across agricultural landscapes. bioRxiv, p. 629782, 2019.] link

há circunstâncias em que você pode querer usar um programa de planilha para produzir cálculos ou números “rápidos e sujos”, e a limpeza de dados ajudará você a usar alguns desses recursos.

Aqui, vamos supor que você provavelmente está usando o Excel como seu programa de planilha principal - há outros (e.g. Calc do OpenOffice) e sua funcionalidade é semelhante, mas o Excel parece ser o programa mais usado por biólogos.
Formatação tabelas de dados em planilhas
Problemas de formatação
Exportando dados
Controle de qualidade
Principais erros

É extremamente importante configurar tabelas bem formatadas desde o início.

Planilha inicial ≠ planilha final
Para reproduzir as análises:
Crie um novo arquivo com seus dados limpos ou analisados. Não modifique o conjunto de dados original ou você nunca saberá onde começou.
Registre as etapas que você realizou na sua limpeza, como faria em qualquer etapa de um experimento, em arquivo de texto simples armazenado na mesma pasta que o arquivo de dados. (Metadados)

As regras principais do uso de programas de planilha eletrônica para dados:
Coloque todas as suas variáveis em colunas - o que você está medindo, como “peso” ou “temperatura”.
Coloque cada observação em sua própria linha.
Não combine várias informações em uma só célula.
Mantenha os dados brutos - não o altere!
Exporte os dados limpos para um formato baseado em texto, como o formato CSV (valores separados por vírgula). Isso garante que qualquer pessoa possa usar os dados e é exigida pela maioria dos repositórios de dados.
Nunca modifique seus dados brutos. Sempre faça uma cópia antes de fazer qualquer alteração.
Registre todos os seus passos para limpar seus dados em um arquivo de texto simples.
Organize seus dados de acordo com os princípios de dados organizados.

[White, Ethan P., et al. “Nine simple ways to make it easier to (re) use your data.” Ideas in Ecology and Evolution 6.2 (2013).]
travessões
etc.
Trate uma célula como se fosse um simples formulário da web que só pode conter texto e espaços.

Salvando em arquivo de texto
Após formatar sua planilha segundo as regras que aprendemos hoje:
Texto (separado por tabulação)(.txt) ou CSV (separado por vírgula)(.csv)
![]()

Você pode ver que existem três guias. Suponha que três estagiários conduziram a coleta de dados e os três registraram os dados à sua maneira. Agora você é a pessoa responsável por este projeto e quer poder começar a analisar os dados.
Identifique o que está errado nesta planilha.
Discuta com seus colegas as etapas necessárias para limpar as guias e colocá-las todas juntas em uma única planilha.
Importante Não se esqueça do nosso primeiro conselho: para criar um novo arquivo (ou guia) para os dados limpos, nunca modifique seus dados originais (brutos).
Depois de passar por este exercício, discutiremos o que havia de errado com esses dados e como você os corrigiria.
salve os todos os arquivos